在医学中,图像注册对于图像引导的干预措施和其他临床应用至关重要。但是,很难解决,通过机器学习的出现,最近在该领域的医疗图像注册方面已经取得了很大的进步。深度神经网络的实施为某些医学应用提供了机会,例如在更少的时间内进行图像注册,以高精度,在操作过程中对抗肿瘤中发挥关键作用。当前的研究对基于无监督的深神经网络的医学图像注册研究的最新文献进行了全面的范围审查,其中包括到本领域在此日期中发表的所有相关研究。在这里,我们试图总结医学领域中无监督的基于深度学习的注册方法的最新发展和应用。在当前的全面范围审查中,精心讨论和传达了基本和主要概念,技术,从不同观点,新颖性和未来方向的统计分析。此外,这篇评论希望帮助那些被这一领域铆接的活跃读者深入了解这一激动人心的领域。
translated by 谷歌翻译
糖尿病(DM)可导致严重的微脉管破坏,最终导致糖尿病性视网膜病变(DR)或由于糖尿病引起的眼睛并发症。如果不受组织的检查,这种疾病会随着时间的流逝而增加,并最终导致完全视力丧失。检测到这种光学发展的一般方法是通过检查视网膜图像的血管,视神经头,微型毛发,出血,渗出液等。最终,这受到经验丰富的眼科医生和大量DM案例的数量的限制。为了启用早期有效的DR诊断,眼科领域需要强大的计算机辅助诊断(CAD)系统。我们的审查旨在为从学生到成熟的研究人员提供给任何人,他们想了解CAD系统及其算法可以完成的工作,再到建模以及计算机视觉和模式识别中的视网膜图像处理领域的发展方向。对于刚开始的人来说,我们特别强调了不同数据库和算法框架的逻辑,优势和缺点,重点是最近的方法。
translated by 谷歌翻译
无线系统应用中深度学习(DL)的成功出现引起了人们对与安全有关的新挑战的担忧。一个这样的安全挑战是对抗性攻击。尽管已经有很多工作证明了基于DL的分类任务对对抗性攻击的敏感性,但是从攻击的角度来看,尚未对无线系统的基于回归的问题进行基于回归的问题。本文的目的是双重的:(i)我们在无线设置中考虑回归问题,并表明对抗性攻击可以打破基于DL的方法,并且(ii)我们将对抗性训练作为对抗性环境中的防御技术的有效性分析并表明基于DL的无线系统对攻击的鲁棒性有了显着改善。具体而言,本文考虑的无线应用程序是基于DL的功率分配,以多细胞大量多输入 - 销售输出系统的下行链路分配,攻击的目的是通过DL模型产生不可行的解决方案。我们扩展了基于梯度的对抗性攻击:快速梯度标志方法(FGSM),动量迭代FGSM和预计的梯度下降方法,以分析具有和没有对抗性训练的考虑的无线应用的敏感性。我们对这些攻击进行了分析深度神经网络(DNN)模型的性能,在这些攻击中,使用白色框和黑盒攻击制作了对抗性扰动。
translated by 谷歌翻译
激光加工是一种高度灵活的非接触式制造技术,在学术界和行业中广泛使用。由于光和物质之间的非线性相互作用,模拟方法非常重要,因为它们通过理解激光处理参数之间的相互关系来帮助增强加工质量。另一方面,实验处理参数优化建议对可用处理参数空间进行系统且耗时的研究。一种智能策略是采用机器学习(ML)技术来捕获Picsecond激光加工参数之间的关系,以找到适当的参数组合,以创建对工业级氧化铝陶瓷的所需削减,并具有深层,平滑和无缺陷的模式。激光参数,例如梁振幅和频率,扫描仪的传递速度以及扫描仪与样品表面的垂直距离的速度,用于预测深度,最高宽度和底部宽度使用ML型号雕刻通道。由于激光参数之间的复杂相关性,因此表明神经网络(NN)是预测输出最有效的。配备了ML模型,该模型可以捕获激光参数与雕刻通道尺寸之间的互连,可以预测所需的输入参数以实现目标通道几何形状。该策略大大降低了开发阶段实验激光加工的成本和精力,而不会损害准确性或性能。开发的技术可以应用于各种陶瓷激光加工过程。
translated by 谷歌翻译
本文报告了Chalearn的Autodl挑战系列的结果和后攻击分析,这有助于对自动学习(DL)进行分类,以便在各种环境中引入的深度学习(DL),但缺乏公平的比较。格式化所有输入数据模型(时间序列,图像,视频,文本,表格)作为张量,所有任务都是多标签分类问题。代码提交已在隐藏的任务上执行,具有限制时间和计算资源,推动快速获取结果的解决方案。在此设置中,DL方法占主导地位,但流行的神经结构搜索(NAS)是不切实际的。解决方案依赖于微调预培训的网络,架构匹配数据模块。挑战后测试没有透露超出强加时间限制的改进。虽然没有组件尤其原始或新颖,但是一个高级模块化组织出现了“Meta-Learner”,“数据摄入”,“模型选择器”,“模型/学习者”和“评估员”。这种模块化使得消融研究,揭示了(离坡)元学习,合奏和高效数据管理的重要性。异构模块组合的实验进一步证实了获胜解决方案的(本地)最优性。我们的挑战队遗产包括一个持久的基准(http://utodl.chalearn.org),获胜者的开放源代码,以及免费的“autodl自助服务”。
translated by 谷歌翻译
它是科学技术的基础,能够预测化学反应及其性质。为实现此类技能,重要的是要培养良好的化学反应表示,或者可以自动从数据中学习此类表示的良好深度学习架构。目前没有普遍和广泛采用的方法,可强健地代表化学反应。大多数现有方法患有一个或多个缺点,例如:(1)缺乏普遍性; (2)缺乏稳健性; (3)缺乏可解释性;或(4)需要过度手动预处理。在这里,我们利用基于图的分子结构表示,以开发和测试一个超图注意神经网络方法,以一次解决反应表示和性能 - 预测问题,减轻了上述缺点。我们使用三个独立数据集化学反应评估三个实验中的这种超照片表示。在所有实验中,基于超图的方法与其他表示和它们相应的化学反应模型相匹配或优于相应的模型,同时产生可解释的多级表示。
translated by 谷歌翻译
神经图像编码现在表示现有的图像压缩方法。但是,在视频域中仍有很多工作。在这项工作中,我们提出了一部结束了学习的视频编解码器,介绍了几个建筑Noveltize以及培训Noveltizes,围绕适应和关注的概念。我们的编解码器被组织为与帧间编解码器配对的帧内编解码器。作为一种建筑新颖,我们建议培训帧间编解码器模型以基于输入视频的分辨率来调整运动估计处理。第二个建筑新奇是一种新的神经块,它将基于分裂的神经网络和Densenets的概念结合了。最后,我们建议在推理时间内过度装备一组解码器侧乘法参数。通过消融研究和对现有技术的比较,我们在编码收益方面表现出我们所提出的技术的好处。我们将编解码器与VVC / H.266和RLVC进行比较,该rlvc分别代表最先进的传统和端到端学习的编解码器,并在2021年在2021年在2021年执行端到端学习方法竞争,e2e_t_ol。我们的编解码器显然优于E2E_T_OL,并在某些设置中对VVC和RLVC有利地进行比较。
translated by 谷歌翻译
污水机构是现代社会中最重要且昂贵的基础设施之一。为了有效地管理污水机构,必须使用自动化的下水道检查。然而,在几十年来调查了下水道缺陷分类的同时,对评估下水道管道劣化水平所需的下水道管道,如水位,管材和管道形状进行了很少的关注。在这项工作中,我们同时分类下水道管道缺陷和属性,并呈现一种新的解码器聚焦的多任务分类架构交叉任务图神经网络(CT-GNN),其使用交叉任务信息来改进脱位的每任务预测。 CT-GNN架构通过利用交叉任务图和唯一类节点嵌入式扩展了传统的脱节任务头解码器。跨任务图可以基于任务类之间的条件概率来确定先验,或者使用自我关注动态确定。 CT-GNN可以添加到任何骨干网上并在参数计数的小幅增加时培训端到端。我们在污水数据集中的所有四个分类任务中实现最先进的性能,分别提高了5.3和8.0个百分点的缺陷分类和水位分类。我们还优于单个任务方法以及其他多任务分类方法,同时引入比以前的专注于以前的模型的方法较少的50倍。 Project Page http://vap.aau.dk/ctgnn提供的代码和模型
translated by 谷歌翻译
人格检测是心理学和自动人格预测(或感知)(APP)的一个古老话题,是对不同类型的人类生成/交换内容(例如文本,语音,图像,视频,视频)对个性的自动化(计算)预测。这项研究的主要目的是自2010年以来对应用程序的自然语言处理方法进行浅(总体)审查。随着深度学习的出现并遵循NLP的转移学习和预先培训的模型,应用程序研究领域已经成为一个热门话题,因此在这篇评论中,方法分为三个;预先训练的独立,预训练的基于模型的多模式方法。此外,为了获得全面的比较,数据集为报告的结果提供了信息。
translated by 谷歌翻译
本文介绍了Halo 1.0,这是一种开放式的可扩展多代理软件框架,该框架实现了一组建议的硬件 - 不合命固式加速器编排(HALO)原理。Halo实现了一个新颖的以计算为中心的消息传递接口(C^2MPI)规范,以启用在异质加速器上的硬件 - 敏捷主机应用程序的性能便携式执行。基于Intel Xeon E5-2620 CPU,Intel Arria 10 GX FPGA和NVIDIA GEFORCE RTX RTX 2080 TI GPU的八个广泛使用的HPC子例程的实验结果表明,Halo 1.0允许在所有统一的控制流程中运行所有统一的控制流程。计算具有最高性能可移植性得分的设备,该设备的最高五个数量级比基于OPENCL的解决方案高五个数量级。
translated by 谷歌翻译